2 research outputs found

    Statistical Audit via Gaussian Mixture Models in Business Intelligence Systems

    Get PDF
    A Business Intelligence (BI) System employs tools from several areas of knowledge for the collection, integration and analysis of data to improve business decision making. The Brazilian Ministry of Planning, Budget and Management (MP) uses a BI System designed with the University of Bras´ılia to ascertain irregularities on the payroll of the Brazilian federal government, performing audit trails on selected items and fields of the payroll database. This current auditing approach is entirely deterministic, since the audit trails look for previously known signatures of irregularities which are composed by means of an ontological method used to represent auditors concept maps. In this work, we propose to incorporate a statistical filter in this existing BI system in order to increase its performance in terms of processing speed and overall system responsiveness. The proposed statistical filter is based on a generative Gaussian Mixture Model (GMM) whose goal is to provide a complete stochastic model of the process, specially the latent probability density function of the generative mixture, and use that model to filter the most probable payrolls. Inserting this statistical filter as a pre-processing stage preceding the deterministic auditing showed to be effective in reducing the amount of data to be analyzed by the audit trails, despite the penalty fee intrinsically associated with stochastic models due to the false negative outcomes that are not further processed. In our approach, gains obtained with the proposed pre-processing stage overcome impacts from false negative outcomes

    Análise preditiva via processos gaussianos e auditoria estatística via Misturas Gaussianas em sistemas de inteligência de negócios

    No full text
    Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2015.Um sistema de Inteligência de Negócios, do inglês \emph{Business Intelligence} (BI), é um sistema de informação que emprega ferramentas de diversas áreas do conhecimento na coleta, integração e análise de dados para aprimorar e embasar o processo decisório em empresas e instituições governamentais. O Ministério do Planejamento, Orçamento e Gestão (MP), órgão do governo federal brasileiro, possui uma série de sistemas de inteligência de negócios e, neste trabalho, dois destes sistemas foram considerados. O primeiro sistema de BI, mantido pela Secretaria de Patrimônio da União (SPU), contém dados de arrecadação mensal de impostos daquela Secretaria, enquanto o segundo sistema de BI, mantido pela Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamento (CGAUD), contém dados da folha de pagamento dos servidores públicos federais brasileiros. Ambos os sistemas foram construídos objetivando-se a detecção de fraudes e irregularidades como evasão fiscal e pagamentos não autorizados. Ao longo deste trabalho, pretende-se incorporar estágios que adicionem análise preditiva e melhorias de performance aos sistemas de BI existentes. No sistema de BI da SPU, Regressão por Processos Gaussianos (RPG) é utilizada para modelar as características intrínsecas da principal série temporal financeira. RPG retorna uma descrição estatística completa da variável estimada, que pode ser tratada como uma medida de confiança e pode ser utilizada como gatilho para classificar dados em confiáveis ou não confiáveis. Ademais, um estágio de pré-processamento reconfigura a série temporal original em uma estrutura bidimensional. O algoritmo resultante, com RPG em seu núcleo, superou métodos preditivos clássicos como indicadores financeiros e redes neurais artificiais. No sistema de BI da CGAUD, um Modelo de Misturas Gaussianas (MMG) é utilizado para descrever o processo estocástico que governa a distribuição de probabilidades dos contracheques. Rotular uma probabilidade relativa em cada contracheque habilita o sistema de BI a listá-los e filtrá-los com base em suas probabilidades. A inserção de um filtro estatístico em um sistema de BI determinístico resultou em efetiva redução na quantidade de dados a serem analisados pelas trilhas de auditoria.A Business Intelligence (BI) system is an information system that employs tools from several areas of knowledge for the collection, integration and analysis of data to improve and support the decision making process in companies and governmental institutions. The Ministry of Planning, Budget and Management, in portuguese Ministério do Planejamento, Orçamento e Gestão (MP), an agency of the Brazilian federal government, possesses a wide number of BI systems and, in this work, two of those systems were considered. The first BI system, maintained by the Federal Patrimony Department, in portuguese Secretaria de Patrimônio da União (SPU), contains data regarding the monthly tax collection of that department, whereas the second BI system, maintained by the Human Resources Auditing Department, in portuguese Coordenadoria de Inteligência e Auditoria Preventiva da Folha de Pagamentos (CGAUD), contains data regarding the payroll of Brazilian federal employees. Both systems were designed aimed at fraud and irregularities detection such as tax evasion and unauthorized payments. Throughout the present work, we aim to incorporate stages into the existing BI systems in order to add predictive analytics and performance enhancements. In the BI system of SPU, Gaussian Process for Regression (GPR) is used to model the intrinsic characteristics of the core financial time series. GPR natively returns a full statistical description of the estimated variable, which can be treated as a measure of confidence and can be used as a trigger to classify trusted and untrusted data. In order to take into account the multidimensional structure of the original data, we also propose a pre-processing stage for reshaping the original time series into a bidimensional structure. The resulting algorithm, with GPR at its core, outperforms classical predictive schemes such as financial indicators and artificial neural networks. In the BI system of CGAUD, a Gaussian Mixture Model (GMM) is used to describe the stochastic process that governs the probability distribution of payrolls. Attaching a relative probability into each payroll enables the BI system to sort and filter payrolls based on their probabilities. Inserting a statistical filter in a deterministic BI system showed to be effective in reducing the amount of data to be analyzed by rule-based audit trails
    corecore